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HE: [目的 /意义 ] 突 发 公共 卫生 事件 严重 危及 全 球 社会 公众 的 生命 健康 。 实 现 信息 资源 对 突 发 事 
件 的 智能 存储 、 查 询 和 知识 组 织 与 输出 等 ， 对 应 和 急 领域 科研 数据 集成 共享 与 领域 知识 管理 具有 重要 的 参 
考 意 义 . [方法 / 过程] 选取 CNKI 和 WOS 为 检索 平台 ， 对 突 发 公共 卫生 事件 进行 检索 ， 爬 取 有 效 数 据 ， 

利用 文献 计量 软件 对 抽取 的 知识 数据 进行 加 工 、 融 合 ， 并 对 高 频 词汇 、 文 献 作 者 和 机 构 进行 聚 类 可 视 化 
分 析 ， 将 知识 实体 、 属 性 及 关系 存储 于 Neo4j 图 数据 库 中 ， 建 立 知识 实体 之 间 的 复杂 联系 ， 进 而 搭建 突 
发 公共 卫生 事件 数据 平台 模型 。[ 结果 / 结论 ] 应 急事 件 智慧 平台 是 一 个 以 信息 资源 为 基础 ， 对 来 自 不 
同 领域 的 信息 进行 处 理 ， 通 过 内 部 实体 的 筛选 与 融合 构建 的 面向 大 众 的 知识 数据 共享 资源 平台 ， 该 平台 
可 以 上 下 交互 实现 信息 资源 流动 ， 切 实 发 挥 信息 资源 对 应 急 管 理工 作 的 作用 。 
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@5I 言 

突 发 公共 卫生 事件 ， 是 指 突然 发 生 ， 造 成 
或 者 可 能 造成 社会 公众 健康 严重 损害 的 重大 传 
染病 疫情 、 群 体 性 不 明 原 因 疾 病 、 重 大 食物 和 
职业 中 毒 以 及 其 他 严重 影响 公众 健康 的 事件 ， 
如 当前 热点 事件 一 一 新 型 冠状 病毒 肺炎 (以 下 
简称 “新 冠 ”) . 20204F1 A 30 AMR, HAE 
生 组 织 (以 下 简称 “ 世 卫 组 织 ” ) 总 干事 谭 德 
赛 在 日 内 瓦 举行 新 闻 发 布 会 ， 声 明 新 型 冠状 病 
毒 感染 的 肺炎 疫情 已 构成 国际 关注 的 突 发 公共 
卫生 事件 。 新 冠 的 爆发 已 艇 动 全 国力 至 全 世界 ， 
疫情 的 肆意 草 延 以 及 进一步 恶化 将 造成 严重 的 
经 济 冲击 和 社会 影响 ， 威 胁 着 世界 人 民 的 生命 
健康 。 

世界 卫生 组 织 在 发 布 会 上 表示 ， 在 习近平 
主席 亲自 指挥 、 亲 自 部 署 疫情 防 控 的 组 织 
中 方 始 终 坚 持 公开 透明 原则 ， 及 时 发 布 信息 ， 
快速 识别 病毒 并 分 享 基因 序列 ,采取 果断 有 力 
的 措施 控制 疫情 传播 。 这些 不 仅 是 对 本 国人 民 
生命 健康 的 高 度 负责 ， 更 是 对 全 球 疾病 防 控 的 
大 力 支持 。 此 外 ， 在 本 次 疫情 中 ， 中 国 采取 的 
大 量 防 控 措 施 远 远 超出 国际 应 对 突 发 事件 的 相 
关 要 求 ， 为 各 国防 疫 工作 设立 了 新 标杆 。 就 日 
前 来 看 ， 中 国 的 疫情 已 得 到 了 有 效 控制 ， 但 是 
国际 的 蔓延 是 对 各 国家 的 又 一 个 挑战 。 世 卫 组 
织 每 日 疫情 报告 显示 ， 截 至 欧洲 中 部 时 间 2020 
年 6 月 12 日 10 时 (北京 时 间 16 时 ) ， 中 国 以 
外 新 冠 确诊 病例 较 前 一 日 增加 136 565 例 ， 达 到 
7325 851 例 ; 中 国 以 外 死亡 病例 较 前 一 日 增加 
49 25 例 ， 达 到 413 649 例 。 全 球 范围 内 ， 新 冠 
确诊 病例 较 前 一 日 增加 136 572 例 ， 达 到 7 410 
510 fil; 死亡 病例 较 前 一 日 增加 4 925 例 ， 达 到 
418 294 例 。 面 对 突 发 公共 卫生 事件 的 严峻 形势 ， 
必须 采取 预防 为 主 、 防 治 结合 的 举措 ， 加 强 联 
防 联 控 ， 制 定 完 善 的 应 对 计划 。 习 总 书记 在 改 
革 完 善 重大 疫情 防 控 救治 体系 中 提 到 ， 国 家 鼓 
励 运 用 大 数据 、 人 工 智 能 、 云 计算 等 数字 技术 ， 
在 疫情 监测 分 析 、 病 毒 溯源 、 防 控 救 治 、 资 源 
调配 等 方面 更 好 地 发 挥 其 支撑 作用 中 。 
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因此 ， 有 必要 续 密 调研 国内 外 突 发 公共 卫 
生 事 件 的 研究 现状 , 抽取 复杂 抽象 的 多 维 数 据 ， 
以 实体 、 关 系 和 属性 的 方式 将 专业 知识 实体 关 
联 化 和 可 视 化 ， 并 基于 精准 全 面 知 识 实体 来 构 
建 应 急 智 翡 数 据 平台 。 通 过 搭建 平台 ， 从 低 密 
度 的 数据 中 提取 有 价值 的 信息 进行 及 时 共享 和 
智慧 分 享 ， 使 得 相关 信息 的 获取 变 得 方便 迅速 
且 高 效 ， 最 终 实现 智能 搜索 和 智能 推荐 帮助 多 
类 型 用 户 快速 精准 地 收集 信息 ， 利 用 信息 资源 
制定 应 急 防 控 措施 ， 对 于 减少 突 发 公共 卫生 事 
件 造成 的 损失 具有 重要 现实 意义 。 


2 相关 研究 


科研 学 术 机 构 可 以 通过 其 自身 职能 和 特点 
支持 和 响应 公共 卫生 对 策 ， 做 出 信息 管理 和 绩 
PETAR. A. L. Dunlop 等 通过 回顾 2001 年 9 H 
11 日 至 2009 年 2 月 1 日 的 文献 和 互联 网 报告 ， 
提出 了 学 术 机 构 作 为 社会 灾害 响应 的 一 部 分 ， 
提供 的 服务 和 资源 可 以 减少 事件 的 不 良 后 果 、 
降低 其 发 生 的 可 能 性 ， 从 而 有 助 于 提高 社区 的 
抗灾 能 力 外。N. A. Vielot 等 对 于 合并 公共 卫生 
防范 和 应 急 管 理 的 作用 是 否 可 以 完善 应 急 计 划 
和 提高 响应 的 效率 和 效力 这 一 问题 ， 在 美国 北 
卡罗来纳 州 的 6 个 县 进行 采访 ， 讨 论 产生 的 机 
遇 和 挑战 趾 。J. Hu 等 研究 建立 了 具有 公共 卫生 
管理 职能 的 农村 应 急 管理 常设 机 构 ， 完 善 了 应 
急 管理 机 制 的 全 过 程 ， 加 大 了 对 农村 公共 卫生 
的 投资 力度 ， 构 建 了 具有 充足 应 急 资 源 储 备 的 
KA", S. Zhong 等 基于 传统 的 云 计算 在 应 急 服 
务 中 存在 延迟 等 缺陷 ， 提 出 了 构建 一 种 基于 边 
缘 计 算 模 型 的 紧急 救援 体系 结构 ， 并 在 此 基础 
上 提供 一 个 资源 调度 模型 ， 从 而 使 其 具有 良好 
的 调度 时 间 和 较 低 的 成 本 ©), 
国内 学 者 也 对 公共 突 发 事件 的 资源 建设 进 
行 了 深入 分 析 。 在 突 发 事件 应 急 情 报 资源 保障 
方面 ， 柯 丹 倩 对 国内 外 突 发 事件 驱动 的 应 急 决 
策 情报 现状 进行 了 综述 分 析 ， 为 后 续 人 研究 做 出 
铺垫 四。 张 永 领 等 将 情景 分 析 引 入 到 评价 模型 ， 
对 应 急 资 源 的 保障 能 力 进 行 全 方位 评价 ， 从 而 


202310.03027v1 


chinaXiv 


AE DE ht 4 RB BE SE eR, FESR UM A 
息 资 源 共 享 、 完 善 应 急 管理 方面 ， 郭 陆 生 等 通 
过 构建 目录 ， 为 应 急 信息 资源 提供 统一 的 标准 
体系 ， 实 现 了 信息 资源 与 应 急 服 务 的 衔接 ， 为 
应 急 信息 资源 跨 部 门 共 享 与 相互 服务 提供 了 便 
利 钼 。 届 腾 佼 等 对 中 国 2003-2018 年 重 特大 突 发 
公共 卫生 事件 案例 和 相关 卫生 应 急 管理 文献 进 
行 归 纳 分 析 ， 阐述 了 中 国 卫生 应 急 管理 现状 。 
在 应 急 决 策 和 信息 融合 方面 ， 李 品 等 实现 了 条 
库 活动 与 情报 研究 内 部 的 融合 ， 构 建 了 支持 智 
库 活动 的 情报 流程 并 协助 智库 产品 产生 的 情报 
体系 中 。 操 玉 杰 等 对 应 急 决 策 信息 需求 与 大 数 
据 环境 下 可 获得 的 应 急 信 息 进行 对 比 ， 构 建 以 
应 急 数据 模型 为 桥梁 、 面 向 应 急 决 策 的 信息 融 
合 服务 整体 框架 ; 逐 层 剖析 数据 层 、 语 义 层 和 
服务 层 应 急 信 息 融 合 中 的 具体 问题 ， 提 出 了 相 
应 的 信息 融合 实现 路 径 。 该 研究 结论 有 助 于 指 
导 突 发 事件 大 数据 融合 系统 构建 ， 也 为 面向 决 
策 的 信息 分 析 提 供 了 实践 参考 依据 中。 

综 上 所 述 ， 现 有 的 研究 成 果 充 分 说 明 ， 在 
信息 化 时 代 应 急 信息 资源 对 应 对 突 发 公共 卫生 
事件 有 着 不 可 或 缺 的 作用 ， 而 目前 还 没有 相关 
学 者 对 应 急 资源 进行 知识 实体 的 构建 。 因 此 ， 
本 文 的 研究 将 从 中 国 知 网 (CNKI) 和 WOS 
( Web of Science ) 中 提取 知识 实体 ， 基 于 知 
识 实体 之 间 的 关系 建立 知识 实体 图 ， 然 后 在 数 
据 库 底层 进行 逻辑 推理 ， 把 突 发 公共 卫生 事件 
相关 的 知识 体系 系统 化 地 展示 给 用 户 ， 通 过 知 
识 实体 图 辅助 科普 领域 大 数据 的 分 析 与 决策 ， 
使 应 急 资 源 的 组 织 更 加 高 效 ， 从 而 提供 更 加 精 
准 的 服务 。 


会 研究 对 象 与 数据 来 源 


本 文 对 国内 中 国 知 网 和 国外 WOS 进行 主 
题 检索 。 首 先 ， 在 中 国 知 网 学 术 期 刊 总 库 检 
索 中 ， 采 用 高 级 检索 的 方式 ， 选 择 的 检索 字 
段 为 “关键 词 ”， 检 索 词 为 “ 突 发 公共 卫生 
事件 ”， 限 定论 文 为 SCI、EI 核心 期 刊 ， 采 
集 时 间 段 为 2010 年 到 2020 年 ,剔除 无 关 文 
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献 后 得 到 检索 结果 为 416 篇 。 其 次 ， 在 Web 
of Science 全 文 数据 库 检索 中 ， 选 择 Web of 
Science 核心 合集 ， 检 索 文 章 的 主题 为 “public 
health emergencies”， 限 定 文 献 类 型 为 Article 
OR Review, 索引 为 SCI-EXPANDED、SSCI、 
A&HCI， 语 种 为 英语 ， 采 集 时 间 段 为 2010 年 
到 2020 年 ， 殊 除 无 关 文 献 后 得 到 的 检索 结 
为 949 篇 。 获 取 相 关 数 据 后 ,采用 可 视 化 的 方法 ， 
从 文献 数量 、 引 文 数量 、 作 者 和 机 构 对 比 等 方 
面 分 析 ， 通 过 科学 计量 指标 ， 对 突 发 公共 卫生 
事件 进行 量化 分 析 。 


人 @@ 知 识 实 体 的 提取 


4.1 知识 实体 提取 方法 

科研 论文 中 的 关键 词 表征 了 一 项 科研 成 果 
的 核心 研究 内 容 ， 是 检索 知识 的 重要 依据 。 本 
研究 利用 文献 计量 可 视 化 工具 Citespace 对 中 外 
文 相关 主题 数据 集 进 行 计量 统计 ， 析 出 核心 关 
键 词 作为 知识 节点 之 一 ， 析 出 核心 专家 与 研究 
机 构 作 为 节点 之 一 。 以 关键 词 “ 突 发 公共 卫生 
事件 ”为 主要 对 象 ， 搭建 知识 实体 的 主要 框架 ; 
对 文档 内 容 进行 分 析 ， 以 自动 提取 的 关键 词 为 
对 象 ， 建 立 关 联 度 强 的 知识 实体 ; 进行 用 户 关 
联 分 析 ， 挖 掘 潜在 的 知识 关联 ， 并 将 普遍 关联 
的 知识 实体 应 用 于 科普 平台 搭建 ， 对 科普 用 户 
进行 科普 知识 个 性 化 推荐 。 以 构建 知识 实体 的 
应 急 资源 平台 为 出 发 点 , 从 科普 知识 实体 抽取 ， 
到 实体 关系 构建 ， 知 识 实体 可 视 化 ， 最 终 实 现 
信息 共享 、 智 能 查询 、 智 能 推荐 等 功能 ， 提 高 
科普 信息 的 利用 率 。 

本 研究 利用 关键 词 共 现 聚 类 形成 网 络 ， 中 
文 数据 集聚 类 如 图 1 所 示 ， 共计 8 个 聚 类 单元 ， 
分 别 为 : 突 发 公共 卫生 事件 、 学 生 保 健 服务 、 
传染 病 、 重 大 突 发 公共 卫生 事件 、 大 数据 、 公 共 
危机 预警 、delphi 法 、 水 痘 。 外 文 数据 集聚 类 如 
图 2 所 示 ， 共 计 7 个 聚 类 ， 分 别 为 resilience、 
ebola, synthetic cannabinoids, radiological, 


emergency preparedness, quarantine, practice 


guidelines, 
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4.2 机 构 发 文 量 分 析 

统计 各 个 机 构 的 发 文 量 ， 得 到 主要 研究 机 
构 名 单 。 在 Citespace 中 选择 节点 Institution， 每 
个 节点 的 时 间 切 片 选 择 Top50 的 点 节点 标签 分 
别 分 析 国内 与 国外 的 机 构 发 文 量 ， 得 到 发 文 量 
统计 表 和 机 构 研究 合作 图 。 
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表 1 是 2010 年 到 2020 年 国内 突 发 公共 
卫生 事件 机 构 的 发 文 量 排名 前 十 的 统计 表 ， 
排名 前 三 的 机 构 分 别 是 武汉 大 学 信息 管理 学 
院 ( 10 篇 )、 江 苏 省 疾病 预防 控制 中 心 (7 篇 )、 

哈尔滨 医科 大 学 卫生 管理 学 院 社 会 医学 教研 
室 (5 篇 ) ， 这 3 所 机 构 的 发 文 量 都 超过 了 5 
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篇 。 表 2 研究 的 是 从 2010 年 到 2020 年 期 间 
国外 突 发 公共 卫生 事件 机 构 的 发 文 量 排名 。 
从 统计 表 的 年 份 看 出 ， 国 内 外 突 发 公共 卫生 
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事件 机 构 的 发 文 量 大 部 分 处 于 这 10 年 间 的 前 
5 年 ， 说 明 各 大 机 构 对 突 发 公共 卫生 事件 领域 
涉及 时 间 都 很 早 。 


表 1 国内 突 发 公共 卫生 事件 机 构 发 文 量 前 十 统计 表 


排序 机 构 名 称 发 文 量 /篇 年 份 区 间 
1 武汉 大 学 信息 管理 学 院 10 2017-2020 
2 江苏 省 疾病 预防 控制 中 心 7 2010-2020 
3 哈尔滨 医科 大 学 卫生 管理 学 院 社 会 医学 教研 室 5 2013-2020 
4 中 国 疾病 预防 控制 中 心 环境 与 健康 相关 产品 安全 所 4 2010-2020 
5 杭州 市 疾病 预防 控制 中 心 3 2015-2020 
6 湖北 省 疾病 预防 控制 中 心 3 2010-2020 
T 清华 大 学 应 急 管理 研究 基地 3 2020 
8 哈尔滨 医科 大 学 卫生 管理 学 院 3 2013-2020 
9 武汉 大 学 信息 资源 研究 中 心 3 2020 
10 北京 市 通州 区 疾病 预防 控制 中 心 3 2010-2020 


图 3 是 国内 突 发 公共 卫生 事件 的 机 构 合 作 
图 ， 本 图 是 利用 Citespace 对 国内 的 机 构 合 作 进 
行 可 视 化 分 析 得 到 的 。 根据 节点 半径 大 小 得 出 ， 
武汉 大 学 信息 管理 学 院 是 这 些 机 构 中 发 文 量 最 
多 的 机 构 ， 其 次 是 江苏 省 疾病 预防 控制 中 心 ， 
哈尔滨 医科 大 学 卫生 管理 学 院 社 会 医学 教研 室 
紧 随 其 后 。 但 之 间 的 合作 却 寥寥 无 几 。 相 比 之 


下 武汉 大 学 信息 资源 研究 中 心 与 排名 第 一 的 武 
汉 大 学 信息 管理 学 院 的 合作 更 多 一 些 。 从 这 些 
机 构 发 文 量 的 分 布 来 看 ， 发 文 机 构 遍 布 全 国 各 
地 ， 说 明 我 国 对 突 发 公共 卫生 事件 的 研究 机 构 
地 理 分 布 比较 均匀 ， 可 以 做 到 按照 本 区 域 公共 
卫生 的 特点 进行 区 域 研究 , 但 国内 尚未 形成 比 
较 深 入 和 密集 的 跨 区 域 跨 机 构 研 究 局 面 。 


《重庆 医科 大 学 公共 卫生 与 管理 学 院 卫生 统计 教研 室 


?清华 大 学 应 急 管理 研究 基地 
清华 大 学 公共 管理 学 院 
《南京 中 医药 大 学 经 贸 管理 学 院 
人 四 川 大 学 华西 医院 急诊 科 
: 7 
(复旦 大 学 公共 卫生 学 院 EN Me ks E A e por 
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ed 
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近 几 年 随 着 突 发 公共 卫生 事件 逐渐 被 重 
视 ， 国 外 的 一 些 机 构 也 对 此 领域 研究 下 足 了 功 
夫 。 表 2 是 国外 研究 机 构 突 发 事件 发 文 量 排名 
前 十 的 统计 表 ， 是 基于 Web of Science if 10 
年 的 机 构 发 文 量 统计 。 其 中 Ctr Dis Control & 
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Prevent ( 美国 疾病 预防 控制 中 心 ) 的 总 发 文 量 
达到 了 88 fi, WHO ( 世界 卫生 组 织 ) 39 篇 、 
Harvard Univ( 哈佛 大 学 )34 篇 、Minist Hlth( 沙 
特 阿 拉 伯 卫生 部 ) 24 篇 、CDC (疾病 预防 控 
制 中 心 ) 23 篇 。 


2 国外 突 发 公共 卫生 事件 机 构 发 文 量 前 十 统计 表 


排序 机 构 名 称 发 文 量 年 份 区 间 
1 Ctr Dis Control & Prevent 88 2010-2020 
2 WHO 39 2010-2020 
3 Harvard Univ 34 2011-2020 
4 Minist Hlth 24 2011-2020 
5 CDC 23 2010-2020 
6 Univ Pittsburgh 20 2010-2020 
7 Emory Univ 19 2012-2020 
8 Johns Hopkins Bloomberg Sch Publ Hlth 19 2012-2020 
9 Univ Toronto 17 2010-2020 
10 Univ Penn 14 2015-2020 


4 是 利用 Citespace 对 Web of science 4% 
心 合集 中 突 发 公共 卫生 事件 文献 可 视 化 ， 得 到 
的 国外 机 构 合 作 的 可 视 化 分 析 图 ， 线 的 粗细 表 
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示 机 构 之 间 的 联系 ， 节 点 的 大 小 表示 机 构 发 文 
频次 的 高 低 。 图 中 线条 节点 都 紧密 联系 在 一 起 ， 
说 明 国 外 的 各 大 机 构 之 间 的 合作 力度 较 强 。 
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4.3 作者 发 文 量 分 析 
在 Citespace 中 选择 Author， 时 间 切 片 选 


择 Top50 的 点 ， 选 择 Thresholding X (2, 1, 
20 ) ， 设 置 节点 参数 发 文 量 为 至 少 3 篇 。 分 析 


2010 年 -2020 年 的 作者 发 文 量 ， 设 置 年 份 间隔 
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说 明 作者 之 间 的 合作 越 紧密 。 在 图 中 ， 黄 色 代 
表 浅 色 ， 结 合 表 3 可 以 得 知 安 囊 是 2016 年 开始 
涉及 突 发 事件 领域 ， 并 且 发 文成 果 可 观 ， 对 此 
领域 做 出 了 贡献 。 


为 1， 得 到 图 5; 分 析 2010 年 -2020 年 的 作者 发 表 3 国内 突 发 公共 卫生 事件 发 文 量 前 十 作者 统计 表 
文 量 ， 将 设置 年 份 间隔 为 1， 得 到 图 6。 排序 作者 发 文 量 / 篇 。 ”年 份 区 间 
表 3 是 经 Citespace 统计 分 析 得 出 发 文 量 排 1 匡 群 红 10 2013-2020 
名 前 十 的 作者 统计 表 ， 可 以 看 出 吴 群 红 在 这 10 par 7 2016-2020 
年 的 发 文 总 量 达到 10 篇 ， 安 璐 7 篇， 刘 静 5 篇 ， 3 刘 静 5 2013-2020 
TB HAE 5 篇 。 说 明 这 些 科研 人 员 在 突 发 公共 卫 4 孝 艳 华 5 2013-2020 
生 事件 的 研究 领域 做 出 了 较 大 贡献 。 5 Tr 4 2013-2020 
用 Citespace 对 作者 进行 可 视 化 分 析 后 得 出 6 周志 衡 4 2012-2020 

国内 作者 合作 分 析 图 ( 见 图 5 ) ， 其 中 颜色 随 发 7 SUF 4 2013-2020 
表 时 间 由 深 变 浅 。 本 图 显示 发 表 2 篇 文献 以 上 8 REE 3 2015-2020 
的 专家 名 称 ， 节 点 半径 越 大 ， 名 字 字 体 越 大 ， 9 ÍREK 3 2015-2020 
代表 作者 发 表 的 文献 数量 越 多 。 连 接线 越 密集 10 刘 敏 3 2011-2020 
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图 5 突 发 公共 卫生 事件 国内 作者 合作 分 析 


表 4 是 WOS 中 2010-2020 年 期 间 排 名 前 
十 的 作者 统计 。 从 表 中 可 以 看 出 发 文 最 多 的 是 
FREDERICK M (7 篇 ) ， 其 研究 方向 是 预防 医 
学 与 卫生 学 。 其 次 是 ELENA SAVOIA (5 篇 )， 
主要 从 事 预 防 医学 、 公 共 卫 生 和 定量 方法 研究 ; 


DANIEL J BARNETT (5 篇 ) 主要 专业 是 急诊 
医学 ; LAINIE RUTKOW (5 篇 ) 主要 采用 法 律 、 
定性 和 定量 的 研究 方法 ， 对 公共 卫生 法 律 和 政 
策 进 行 研究 。 

图 6 显示 了 WOS 中 作者 的 分 布 。 如 图 
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所 示 ， 节点 越 大 表示 作者 发 文 量 越 多 ， 节 
点 年 轮 的 颜色 变化 反映 了 作者 活 跌 的 不 同 
时 期 。 从 图 中 可 以 看 出 ， 这 些 作者 的 联系 


表 4 国外 突 发 公共 卫生 事件 发 文 量 前 十 作者 统计 表 


ChinaXiv 合 作 期 刊 


并 不 紧密 ， 发 文 量 前 三 名 的 作者 几乎 没有 
合作 关系 ， 都 在 以 独自 的 思维 方式 去 进行 


研究。 


排序 作者 发 文 量 年 份 区 间 
1 FREDERICK M 7 2011-2020 
2 ELENA SAVOIA 5 2014-2020 
3 DANIEL J BARNETT 5 2010-2020 
4 LAINIE RUTKOW 5 2014-2020 
5 KATHERINE SEIB 4 2012-2020 
6 SAAD B OMER 4 2012-2020 
T NIRANJAN KISSOON 4 2011-2020 
8 JAMES G 4 2011-2020 
9 ZHANAT CARR 3 2010-2020 
10 JON S VERNICK 3 2014-2020 
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图 6 突 发 公共 卫生 事 伯 


4.4 突 发 公共 卫生 事件 知识 实体 构建 
4.4.1 知识 实体 图 相关 概念 

知识 实体 图 ， 又 称 为 知识 域 可 视 化 或 知识 
领域 映射 地 图 ， 是 显示 知识 发 展 进 程 与 结构 关 
系 的 一 系列 各 种 不 同 的 图 形 。 用 可 视 化 技术 描 
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F 国 外 作者 合作 分 析 


述 知 识 资源 及 其 载体 ， 挖 气 、 分 析 、 构 建 、 绘 
制 并 显示 知识 及 其 相互 联系 。 其 本 质 就 是 一 种 
大 规模 的 语义 网 络 ， 富 含 实体 、 概 念 及 关系 ， 
是 大 规模 数据 知识 表示 的 方法 之 一 。 

知识 实体 可 以 存储 总 结 不 断 迭 代 的 知识 、 
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规则 、 元 数据 等 多 类 型 的 数据 或 者 融合 结构 化 
与 非 结 构 化 的 数据 ， 可 以 利用 它 来 分 析 关 系 复 
林 的 多 维 数 据 。 知 识 实体 图 主要 有 两 种 存储 方 
式 : 一 种 是 基于 RDF! 的 存储 ， 一 种 是 基于 图 
数据 库 的 存储 。RDF 以 三 元 组 方式 来 存储 数据 
而 且 不 包含 属性 信息 ， 但 图 数据 库 一 般 以 属性 
图 为 基本 的 表示 形式 ， 实 体 和 关系 可 以 包含 属 
性 ， 这 样 更 容易 表达 现实 的 业务 场景 ， 它 们 之 
间 的 主要 区 别 就 是 RDF 中 的 一 个 重要 设计 原则 
是 数据 的 易 发 布 及 共享 ， 而 图 数据 库 则 把 重点 
放 在 了 高 效 的 图 查询 和 搜索 上 。 图 7 和 图 8 就 
是 基于 Neo4jt 图 数据 库 做 出 的 知识 实体 图 。 
Neo4j 是 目前 使 用 率 最 高 的 图 数据 库 ， 以 
描述 实体 的 属性 与 实体 间 的 关系 为 主 ， 用 图 
的 形式 存储 。 它 拥有 自己 的 数据 库存 储 ， 支 
持 320 亿 的 关系 节点 和 640 亿 的 属性 。Neo4j 
拥有 活跃 的 社区 ， 查 询 效 率 高 ， 但 缺点 为 分 
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布 式 存储 实现 代价 高 ， 更 新 速度 慢 。Neo4j 也 
是 一 种 非 关 系 型 数据 库 ， 它 用 “节点 ”和 “ 关 
系 ” 来 存储 数据 与 数据 间 的 关联 ， 由 于 不 需 
要 固定 的 schema， 可 以 随 项 目 发 展 扩展 节点 
上 的 属性 。 

本 研究 以 CNKI 和 WOS 提取 的 数据 集中 
的 主要 关键 词 、 研 究 者 和 机 构 聚 类 名 称 ， 作 
为 实体 节点 名 称 。 全 部 融合 考虑 以 上 知识 节 
点 后 ,将 突 发 公共 卫生 事件 知识 实体 分 为 5 
部 分 ， 即 突 发 公共 卫生 级 别 、 防 控 措 施 、 传 
染病 、 专 家 和 机 构 。 然 后 定义 实体 与 实体 、 


实体 与 属性 之 间 的 关系 ， 用 CREATE 语句 创 
建 节点 、 属 性 和 关系 。 最 后 ， 我 们 将 所 有 命 


名 的 实体 及 实体 关系 导入 Neo4j 图 数据 库 ， 
得 到 图 7 突 发 公共 卫生 事件 知识 实体 图 和 图 8 


新 冠 在 中 西医 研究 方面 知识 融合 实体 图 两 个 
重要 知识 实体 图 。 
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图 8 新 冠 在 中 西医 研究 方面 知识 融合 实体 图 


@ © 
se 


4.4.2 突 发 公共 卫生 事件 知识 实体 的 构建 

图 7 是 突 发 公共 卫生 事件 的 知识 实体 图 ， 
由 节点 和 边 构 成 的 ， 其 中 圆圈 代表 一 个 节点 ， 
即 知 识 实体 中 的 实体 ， 实 体 之 间 的 边 代表 属性 
与 节点 的 关系 ， 关 系 可 以 用 箭头 来 表示 方向 ， 
两 端 对 应 开始 节点 和 结束 节点 。 在 节点 上 加 一 
个 或 多 个 标签 表示 实体 的 分 类 ， 和 一 个 键 值 对 
集合 来 表示 实体 关系 属性 外 的 其 他 属性 ， 这 时 
关系 也 可 以 附带 额外 属性 。 我 们 一 般 都 是 将 实 
体 的 property-value ( 属性 值 ) 表示 在 图 中 ， 由 
于 属性 和 节点 分 开 储存 ， 其 属性 可 以 用 MARCH 
命令 和 WHERE 子 句 来 迅速 实现 查询 ， 部 分 节 
点 属性 如 表 5 所 示 。 

突 发 公共 卫生 事件 知识 实体 图 是 根据 
图 1 和 图 2 的 关键 词 聚 类 分 析 、 图 3 和 图 5 
的 作者 合作 分 析 以 及 图 4 和 图 6 的 机 构 合作 
分 析 来 创建 的 ， 它 的 两 个 一 级 知识 实体 分 别 
为 “ 突 发 公共 卫生 事件 ”与 “Public health 
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oe 


emergencies”， 用 最 大 的 圈 来 展示 日 设置 为 
蓝 色 ， 中 英两 个 一 级 实体 的 设 定 是 为 后 续 知 识 
实体 在 中 外 文 两 方面 同时 展开 增长 做 好 准备 工 
作 。 根 据 上 文 的 关键 词 聚 类 可 视 化 分 析 ， 本 文 
把 突 发 公共 卫生 事件 分 为 五 大 部 分 : 突 发 公共 
卫生 事件 级 别 、 防 控 措施 、 传 染病 、 专 家 和 机 构 ， 
将 这 5 个 实体 与 “ 突 发 公共 卫生 事件 ”的 实体 
的 关系 属性 设 为 “INCLUDE”， 即 是 “属于 ” 
上 一 级 的 下 位 类 。《 国 家 突 发 公共 卫生 事件 应 
急 预 案 》 第 1.3 条 第 2 项 规定 ， 根 据 突 发 公共 
卫生 事件 性 质 、 和 危害 程度 、 涉 及 范围 ， 突 发 公 
共 卫 生 事件 可 划分 为 特别 重大 ( 工 级 ) 、 重 大 
(TR) 、 较 大 CMA) 和 一 般 (NVK) 四 级 
H SWERK” MAER, “ERK” HE 
色 表 示 、“ 较 大 ”用 黄色 表示 、“ 一 般 ” 用 绿 
色 表 示 ， 设 置 这 4 个 实体 节点 与 “ 突 发 公共 卫 
生 事件 级 别 ” 实体 节点 的 关系 属性 为 "SORT( 分 
类 ) ”。 在 防 挖 措施 方面 ,我 国 积极 做 到 了 “应 
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急 管 理 ”“ 卫 生 应 急 ” “疫情 防 控 ” 和 “防治 ”， 
这 4 个 实体 的 聚 类 程度 和 实践 意义 都 比较 强 ， 
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爆发 的 “新 冠 ”使 我 国 多 个 城市 做 出 了 一 级 响 
应 ， 所 以 用 红色 圈 重 点 标识 。 根 据 上 文 作者 发 


用 绿色 的 节点 表示 。 突 发 公共 卫生 事件 最 严重 
的 事件 就 是 “传染 病 ”， 其 中 对 人 类 造成 巨大 


文 统 计 表 和 机 构 发 文 统计 表 ， 将 专家 和 机 构 发 
文 量 的 前 三 名 放 进 知识 实体 库 中 分 别 用 紫红 色 


EEDA “WE” “Sars” “KÆ” F, 今年 和 蓝 色 表示 。 
表 5 突 发 公共 卫生 事件 知识 实体 属性 表 

ID P1_name P1_value P2_name P2_value P3_name P3_value 
4003 Keyword 突 发 公共 卫生 事件 Search range 416 From 中 国 知 网 
4004 Keyword Public Health Emergencies Search range 964 From Web of science 
4005 Dept emergency Branch Number 4 nodeType String 
4010 Dept Experts Branch Number 3 nodeType String 
4014 Dept Institutions Branch Number 3 nodeType String 
4018 Dept 传染 病 Branch Number 3 nodeType String 
4019 Dept 防 控 措 施 Branch Number 4 nodeType String 
4020 Dept 突 发 公共 卫生 事件 级 别 Branch Number 4 nodeType String 
4021 Dept 专家 Branch Number 3 nodeType String 
4022 Dept 机 构 Branch Number 3 nodeType String 
4034 Name 吴 群 红 Total literatures 360 Organization 哈尔滨 医科 大 学 
4035 Name 安 璐 Total literatures 67 Organization 武汉 大 学 
4036 Name xii Total literatures 37 Organization 郑州 大 学 


对 于 国外 部 分 的 知识 实体 建设 ， 本 文 主要 
根据 聚 类 结果 将 “Public health emergencies” 3 
件 分 为 三 部 分 ， 第 一 部 分 为 “Emergency”， 
包 ff ebola, radiological, novel coronavirus 和 
quarantine 等 ， 第 二 部 分 和 第 三 部 分 分 别 为 

“Expers” 和 “Institutions”， 根 据 国 外 作者 
发 文 统计 表 将 作者 FREDERICK M, ELENA 
SAVOIA 和 DANIEL J BARNETT 等 和 国外 机 构 
发 文 机 构 加 入 知识 实体 。 

4.4.3 突 发 公共 卫生 事件 的 节点 属性 

表 5 是 突 发 公共 卫生 事件 知识 实体 图 部 分 
节点 属性 的 展 列 , 属性 是 描述 节点 或 边 的 性 质 ， 
可 以 用 键 值 对 (key-value ) "来 表示 。Neo4j 
在 创建 属性 时 分 为 两 部 分 Property-name ( 属性 
名 称 ) 和 Property-value ( 属性 的 值 ) 两 部 分 ， 
同一 属性 名 可 对 应 多 个 属性 值 。 突 发 公共 卫生 


事件 知识 实体 属性 表 ( 见 表 5) ， 表 头 是 由 节 
点 的 ID 、3 个 属性 名 称 和 其 对 应 的 属性 值 构成 
的 。 其 中 ， 知 识 节 点 的 ID 是 在 创建 节点 时 自动 
形成 ， 且 ID 是 唯一 的 。 属 性 表 的 第 一 列 的 元 素 
是 每 个 节点 的 ID, 第 二 、 四 、 六 列 是 指 对 每 个 节 
点 设置 的 属性 名 称 (Pl name、P2 name, P3_ 
name) ， 第 三 、 五 、 七 列 分 别 是 其 前 一 列 的 属 
ME {EL (Pl value, P2 value, P3 value) 。 一 般 
情况 下 ， 节 点 有 多 个 属性 时 ， 系 统 会 自动 选择 
name 属性 的 属性 值 在 图 上 显示 ， 如 : Person:pe 
rson{age:20,sex:” woman” ,name:” Lisa” }, 最 
终 在 图 中 显示 的 是 “Lisa”。 将 表 5 第 二 列 的 属 
性 名 称 对 应 的 属性 值 显示 在 图 7 中。 除 图 中 显 
示 的 属性 值 ， 属 性 表 将 所 有 含有 下 位 类 的 节点 
及 部 分 子 节 点 的 所 有 属性 都 罗列 出 来 了 ， 如 ID 
为 4003 的 属性 名 keyword 对 应 的 属性 值 是 突 发 
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公共 卫生 事件 ， 属 性 名 search range 检索 量 对 应 
的 属性 值 为 1278， 属 性 名 from 来 源 对 应 属性 值 
为 中 国 知 网 。 
4.4.4 知识 实体 查询 

Neo4j 图 数据 库 通过 Cypher"! 语言 实现 对 
图 的 查询 操作 。 在 图 形 数据 库 Neo4 P, Alii 
历 查 询 的 速度 是 一 个 独立 于 遍历 数据 量 大 小 的 
稼 数 ， 仅 当 需 要 访问 某 节 点 或 关系 时 ， 图 形 数 
据 库 Neo4j 才 会 对 其 进行 遍历 并 返回 节点 。 当 
使 用 Cypher 语句 MATCH 匹配 正则 表达 式 时 ， 
Cypher 语句 是 一 个 描述 性 的 图 查询 语言 ， 会 自 
动 调用 内 置 的 遍历 搜索 算法 遍历 访问 ， 不 需要 
人 为 指定 遍历 搜索 方式 , 即 可 遍历 得 到 整 张 图 。 

8 是 对 图 7 使 用 Cypher 查询 语句 得 到 的 
网 络 图 ， 是 参考 《新 型 冠状 病毒 肺炎 文献 整理 
及 研究 概述 》" ”和 《基于 中 医 经 典 理论 探讨 新 
型 冠状 病毒 肺炎 的 防治 》 呈 ， 对 新 冠 展开 的 中 
西医 药学 的 诊断 、 治 疗 和 预防 研究 的 概括 总 结 。 
其 查询 语句 是 : 

MATCH(Sara:sara) 

MATCH(Sara:sara)-[rl:IN]->(n1)-[12:IN]- 
>(n2)-[13:IN]->(n3) 

RETURN Sara,n1,r1,n2,r2,n3,r3 

MATCH 和 RETURN 是 Cypher 的 关键 字 ; 
Sara 是 变量 用 来 保存 节点 ; sara 是 标签 ; rl, 
12, B 代表 节点 之 间 的 关系 ; nl, n2, n3 是 指 
与 上 一 位 节点 关系 为 “IN” 的 所 有 节点 。 当 实 
行 第 一 段 语句 时 ， 查 询 得 到 一 个 名 为 “新 型 冠 
状 病毒 ”的 红色 节点 ; 随后 执行 到 “nl1” 时 ， 
经 数据 库 查 询 显 示 “ 中 医药 学 ”和 “西医 药 
学 ”两 个 节点 ( 用 紫色 表示 ) ; 执行 到 “n2” 
时 ， 查 询 得 到 “中 医药 学 ”和 “西医 药学 ”两 
个 节点 的 所 有 下 位 类 一 一 诊断 、 治 疗 和 预防 
( 用 蓝 色 表示 节点 ) ; 执行 完整 个 语句 时 ， 才 
查询 出 图 8 内 包含 的 所 有 节点 ， 并 且 只 有 实行 
RETURN 返回 语句 ， 才 会 将 这 些 市 点 显示 在 
中 ( 见 图 8)。 

该 知识 实体 是 站 在 中 西医 角度 分 别 从 不 同 
方面 对 新 冠 展 开 人 研究 ， 归 纳 总 结 出 新 冠 的 相关 
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结论 ,不仅 促进 了 人 们 对 新 冠 的 深入 了 解 ， 而 
且 有 利于 充分 发 挥 医 疗 系统 在 诊断 治疗 中 的 作 
用 ,便于 更 好 地 制定 防 控 措施 及 救援 方案 。 因 
此 次 疫情 的 影响 范围 广泛 ， 全 球 各 地 的 科研 人 
员 对 COVID-19 的 病毒 来 源 、 传 播 途径 、 疫 情 
预测 、 诊 断 和 治疗 等 各 个 方面 展开 研究 ， 从 陈 
莹 中 等 的 可 视 化 研究 中 可 以 看 出 国内 外 对 新 冠 
的 重视 ， 相 信 在 科研 人 员 的 努力 下 能 够 早日 攻 
克 难 关 。 


O 基于 知识 实体 的 应 急 突 发 公共 卫 
生 事件 数据 平台 构建 


如 前 文 所 述 ， 知 识 实体 图 是 对 物理 世界 的 
符号 表达 ， 描 述 现实 事件 中 存在 的 一 些 概念 以 
及 它们 之 间 的 联系 “。 应 急 资 源 平台 基于 知识 
实体 图 而 构建 ， 采 用 自 底 向 上 的 运作 模式 。 拱 
建 基于 知识 实体 的 应 急 资源 平台 ， 以 突 发 公共 
卫生 事件 为 基础 ， 挖 掘 当前 新 冠 疫情 内 部 以 及 
突 发 事件 之 间 的 多 元 化 关系 ， 可 视 化 地 展现 给 
用 户 ， 可 以 使 得 信息 的 获取 变 得 方便 迅速 且 高 
效 。 用 户 通 过 智能 搜索 和 智能 推荐 能 够 快速 精 
准 地 收集 信息 ， 更 好 地 利用 信息 资源 做 好 应 急 
防 控 措 施 。 

如 图 9 所 示 ， 应 急 资 源 平台 包含 数据 层 、 
知识 库 构 建 、 数 据 存储 和 数据 应 用 层 四 部 分 。 

第 一 部 分 数据 层 位 于 平台 的 最 底层 ， 主 要 
包括 数据 和 采集、 数据 清洗 、 数 据 转换 及 标准 化 ， 
经 过 数据 人 处理 后 得 到 的 非 结 构 化 数据 和 半 结 构 
化 数据 作为 构建 知识 实体 库 的 数据 源 。 在 该 层 
次 掌握 国内 外 有 关 突 发 公共 卫生 事件 的 研究 现 
1K, 进行 逻辑 推理 ， 从 大 数据 中 分 析 突 发 公共 
卫生 事件 的 规律 , 让 事物 的 发 展 变 得 有 迹 可 循 ， 
从 而 形成 搭建 知识 平台 底层 的 架构 。 

原始 数据 按照 数据 的 结构 化 程度 可 以 划分 
为 结构 化 数据 、 半 结构 化 数据 和 非 结构 化 数据 。 
结构 化 数据 即行 数据 , 是 存储 在 数据 库 里 ,可 以 
用 二 维 表 结 构 来 逻辑 表达 实现 的 数据 ， 主 要 通 
过 关系 型 数据 库 进行 存储 和 管理 。 半 结构 化 数 
据 ， 是 结构 化 数据 的 一 种 形式 ， 虽 不 符合 关系 
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型 数据 库 或 其 他 数据 表 的 形式 关联 起 来 的 数据 
模型 结构 ， 但 包含 相关 标记 ， 用 来 分 隔 语义 元 
素 以 及 对 记录 和 字段 进行 分 层 。 非 结构 化 数据 
是 数据 结构 不 规则 或 不 完整 ， 没 有 预定 义 的 数 


VAE 


if 

休 关系 设计 

格 

5 属性 设计 
数据 层 


(购买 /柔和 集 ) 


图 9 突 发 公共 卫 


第 二 部 分 为 知识 实体 构建 ， 位 于 数据 层 的 
上 方 ， 包括 知识 抽取 、 实 体 对 齐 和 知识 设计 ， 
是 平台 的 重要 组 成 ， 有 着 承上启下 的 作用 。 通 
常 一 个 知识 图 谱 的 构成 包括 实体 集 ( 实体 的 个 
Bl). RAR (关系 的 数目 ) 以 及 对 应 的 三 元 组 。 
本 体 构 建 模块 中 主要 是 对 突 发 公共 卫生 事件 概 
念 表达 ， 用 抽象 的 概念 表达 真实 的 存在 ， 是 一 
个 迭代 的 过 程 。 借 助 本 体 的 约束 来 规范 实体 、 
关系 以 及 实体 属性 之 间 的 联系 ， 可 以 有 效 解 决 
“信息 孤岛 ”的 现象 ， 形 成 本 体 化 的 知识 表达 。 

本 文 提取 了 突 发 公共 卫生 事件 的 实体 和 关 
系 ， 用 实体 、 属 性 、 属 性 值 这 样 的 三 元 组 来 表 
达 事 实 。 首 先 搭建 出 “ 突 发 公共 卫生 事件 ”和 
“public health emergencies” 两 个 一 级 知识 实体 ， 
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据 模型 ,不 方便 用 数据 库 二 维 逻 辑 表 来 表现 的 
数据 。 包 括 关 于 菏 一 类 应 急 突 发 事件 所 有 格式 
的 办 公文 档 、 文 本 、 图 片 、HTML、 各 类 报表 、 
图 像 和 音频 、 视 频 信息 等 。 


智能 搜索 突 发 事件 


Citespace 


可 视 化 分 析 


数据 转换 
(标准 化 ) 


半 结 构 化 数据 


件数 据 平 台 总 体 框架 


再 根据 中 国 知 网 和 WOS 文献 中 关键 词 、 作 者 和 
机 构 聚 类 的 数据 ， 划 分 出 下 一 级 的 知识 实体 ， 
完成 了 知识 实体 的 构建 。 之 后 分 析 突 发 公共 卫 
生 事件 的 节点 属性 ， 通 过 属性 值 刻画 出 实体 之 
间 的 内 在 特性 ， 用 关系 来 连接 两 个 实体 ， 深 入 
挖掘 内 部 联系 。 

在 该 过 程 中 ， 知 识 抽取 涉及 的 关键 技术 包 
括 实体 抽取 、 关 系 抽取 和 属性 抽取 。 本 文 从 原 
始 的 非 结 构 化 和 半 结 构 化 数据 中 ， 即 从 国内 的 
中 国 知 网 和 国外 的 WOS 检索 到 的 关于 突 发 公共 
卫生 事件 的 相关 文献 中 ,提取 关 键 词 、 作 者 和 
机 构 等 关键 知识 实体 ， 把 排名 前 十 的 文献 作者 
和 机 构 进行 梳理 统计 ， 将 汇聚 的 实体 知识 加 以 
规范 ， 完 成 本 体 模 块 模 型 构建 ， 利 用 Citespace 
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可 视 化 软件 进行 初步 知识 展示 。 获 取 到 实体 、 
关系 以 及 实体 的 属性 信息 后 ， 接 下 来 要 将 这 些 
碎片 化 的 信息 进行 融合 ， 进 行 知 识 实体 消 歧 、 
共 指 消解 ， 它 的 过 程 有 实体 链接 ， 适 用 于 半 结 
构 化 和 非 结 构 化 数据 通过 信息 抽取 提取 出 来 的 
数据 ; 知识 合并 ， 主 要 对 结构 化 数据 ( 如 外 部 知 
识 库 和 关系 数据 库 ) 进行 处 理 。 

第 三 部 分 为 数据 存储 层 ， 位 于 知识 实体 库 
的 上 层 ， 其 构建 基于 知识 实体 库 的 实体 数据 。 
在 知识 实体 有 大 量 数据 的 复杂 的 情况 下 ， 就 会 
显得 传统 的 关系 数据 存储 方式 有 些 低 效 耗 时 ， 
因此 使 用 图 数据 库 在 查询 工作 中 会 明显 提升 工 
作 效 率 ， 更 易于 图 查询 和 搜索 。 

在 该 层次 提取 新 冠 的 知识 实体 ， 从 中 医药 
学 和 西医 药学 两 个 方面 划分 知识 实体 ， 归 纳 新 
冠 的 相关 结论 。 把 最 底层 的 数据 转化 为 具有 决 
策 价值 的 信息 ， 将 有 价值 的 信息 沉淀 下 来 与 人 
的 知识 体系 融合 ， 形 成 一 个 完整 的 知识 体系 。 
用 图 的 形式 存储 ， 选 择 图 数据 库 Neo4j 作为 描 
述 实体 属性 与 实体 之 间 关 系 的 存储 介质 。 在 
Neo4j 图 数据 库 中 建立 节点 、 关 系 、 属 性 等 ， 形 
成 知识 图 谱 ， 就 可 以 进行 下 一 步 的 查询 了 。 

将 数据 存储 在 网 络 上 ， 基 于 图 的 搜索 ， 具 
有 完全 事务 管理 功能 ， 可 以 很 好 地 支撑 动态 数 
据 特 性 的 应 用 需求 。 根 据 本 体 模块 对 应 的 相关 
概念 建立 于 实体 数据 之 间 的 关系 ， 实 现 概念 的 
实体 、 关 系 、 属 性 的 知识 实体 可 视 化 。 

第 四 部 分 数据 应 用 层 位 于 平台 的 顶端 ， 是 
平台 的 最 终 形式 ， 主 要 面向 对 象 有 普通 大 众 、 
政府 工作 人 员 、 医 务工 作者 、 科 研 人 员 、 教 育 
教学 者 等 ， 是 一 种 基于 知识 为 用 户 提供 服务 的 
智慧 搜索 引擎 ， 能 够 结合 生活 实际 ， 通 过 一 般 
规律 找到 解决 问题 的 方法 ， 实 现 从 了 解 问题 到 
明白 如 何 解决 问题 的 转变 。 智 能 查询 应 急 防 控 
和 智能 搜索 突 发 事件 等 功能 的 实现 ， 便 于 用 户 
更 加 精准 有 效 地 得 到 自己 需要 的 知识 ， 为 应 急 
救援 决策 提供 切实 可 行 的 应 对 策略 。 在 大 数据 
的 支撑 下 ， 利 用 知识 实体 图 实现 搜索 结果 的 可 
视 化、 体系 化 ， 使 知识 体系 构成 网 状 节 点 ， 展 
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现 更 加 精准 的 信息 。 应 急事 件 大 数据 平台 不 是 
简单 的 数据 输入 和 输出 ， 而 是 一 个 以 信息 资源 
为 基础 ， 对 来 自 不 同 领 域 的 信息 进行 处 理 ， 通 
过 内 部 实体 的 筛选 与 融合 构建 的 面向 大 众 的 共 


享 资源 平台 。 


@ 结 语 与 思 


应 急 突 发 事件 下 ， 信 息 资 源 的 高 效 利用 对 
事件 的 处 理 影响 是 巨大 的 ， 而 资源 的 不 充分 利 
用 会 成 为 有 限 资 源 的 一 种 浪费 。 利 用 大 数据 实 
现 从 简单 信息 服务 到 知识 服务 的 提升 是 必然 的 ， 
所 以 利用 大 数据 技术 挖掘 、 分 析 有 用 的 数据 ， 
对 资源 进行 充分 有 效 的 利用 变 得 尤为 重要 。 本 
文 以 疫情 防 控 和 突 发 公共 卫生 事件 为 基础 ， 研 
究 经 历 了 以 下 阶段 : 中 搜集 相关 资料 ， 建 立 基 
于 知识 实体 的 突 发 卫生 公共 事件 平台 搭建 思路 ; 
@) 在 中 国 知 网 和 WOS 数据 库 ， 分 别 以 “ 突 发 公 
tt AES” “public health emergencies” 关 键 
词 进 行 高 级 检索 ; 图 通过 构建 知识 实体 ， 深 入 
主题 进行 前 述 ， 挖 掘 当 前 新 冠 疫情 内 部 以 及 突 
发 事件 之 间 的 多 元 化 关系 ; 由 对 基于 知识 实体 
的 应 急 大 数据 的 构建 进行 细 化 ， 将 问题 延伸 。 
在 此 基础 上 构建 应 急 资 源 平 台 ， 发 挥 信息 化 对 
辅助 疫情 诊断 、 创 新 医疗 模式 、 提 升 服务 效率 
等 方面 的 作用 ， 从 而 做 好 疫情 发 现 、 防 控 和 应 
急 处 置 工作 。 

基于 知识 图 谱 构建 应 急 资 源 平 台 ， 在 理论 
层面 ， 将 知识 实体 的 理论 方法 应 用 于 智库 的 建 
设 ， 且 此 知识 实体 是 不 断 扩充 和 生长 的 ,不仅 
丰富 智慧 数据 平台 建设 的 知识 实体 方法 理论 ， 
也 有 效 地 解决 了 数据 平台 的 生命 力 和 持续 性 的 
问题 ; 在 应 用 层面 ， 依 靠 权威 的 文献 数据 库 平 
台 来 获取 知识 实体 ， 可 以 使 信息 获取 变 得 方便 
迅速 有 高 效 ， 且 对 于 多 年 来 发 生 的 一 系列 公共 
卫生 突 发 事件 进行 实体 提取 ， 可 以 在 同类 型 事 
件 下 查询 到 可 借鉴 的 预防 、 治 疗 、 应 对 等 方法 ， 
为 公共 卫生 事件 应 急 决 策 提供 了 有 力 文 撑 。 

现 阶 段 知识 实体 的 构建 在 我 国 还 处 于 发 展 
初期 ， 许 多 技术 及 知识 获取 的 算法 还 有 待 改善 
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和 发 展 。 然 而 要 特别 指出 的 是 ， 突 发 公共 卫生 
事件 数据 平台 的 构建 是 一 个 复杂 的 过 程 ， 其 中 
会 涉及 到 不 同 的 环境 背景 、 主 体 、 文 化 以 及 运 
行 机 制 等 。 本 文 构建 的 基于 知识 实体 的 应 急事 
件 大 数据 平台 仅仅 是 一 个 模型 ， 现 有 的 研究 数 
量 有 一 定 的 局 限 , 面 对 多 变 难 掌握 的 环境 因素 ， 
相关 结论 需要 进一步 验证 与 完善 ， 理 论 与 实践 
HE, 人 文 与 技术 相 融 合 。 在 下 一 步 规划 设想 中 ， 
将 会 增加 更 多 的 数据 集 ， 构 建 基于 知识 实体 的 
应 急事 件 大 数据 平台 ， 应 用 于 不 同 领域 ， 有 效 
应 对 不 同类 型 的 突 发 事件 。 
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Study on Construction of Emergent Public Health Event Data Platform Based on Knowledge 
Entity 
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Abstract: [Purpose/significance] The public health emergencies endanger social public life health 
around global seriously. The realization of information resources for the intelligent storage, query, and 
knowledge of emergency organization and output has important reference significance for the integration 
sharing of scientific research data and knowledge management in emergency field. [Method/process] This 
paper selected the China Knowledge Network and Web of Science as the retrieval platform. Set health 
emergencies as the search conditions to crawl valid data, and used literature measurement software to 
extract knowledge data processing and fusion, and did cluster visualization analysis of the high frequency 
vocabulary, the author of the literature, and institutions. Then the knowledge entity, attribute and relation 
were stored in the Neo4j graph database, and the complex relation between knowledge entities was 
established, finally built the public health emergencies data platform model. [Result/conclusion] Emergency 
event wisdom platform is a knowledge data sharing resource platform facing the public which is based on the 
information resources. It can processes the information from different areas, and is built by the screening and 
fusion of internal entity. The platform can realize information resources flow by upper and lower interaction, 
to play the role of information resources of emergency management work. 
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